向量空间模型相关论文
在软件开发过程中,用户或测试人员在发现被测软件异常情况后,会提交描述相关问题的缺陷报告,开发人员需要仔细分析缺陷报告并查看......
个人特征是用来衡量行为,思想和情感的习惯性模式。它因人而异,并且随着时间的推移在不同的情景下保持相对稳定。个人特征具有重要......
文本相似度计算是文本挖掘过程中的一项关键技术,被广泛应用于文本分类、机器翻译、搜索引擎、抄袭检测、自动问答等领域。目前应......
自然语言处理是人工智能的核心技术,文本表示是自然语言处理的基础性和必要性工作,影响甚至决定着自然语言处理系统的质量和性能.......
软件缺陷与漏洞是造成软件安全问题的根源,对缺陷和漏洞进行预测是软件测试领域的重要组成部分,有助于合理分配测试资源,是提高软件质......
Internet的开放性和日益增长的规模,为人们提供了自由交换信息的便捷手段。同时巨大的开放信息源也使一些恶意的和不良的(反动、色......
针对国家科技图书文献中心文献检索系统,提出关于二次文献的文献相似度计算方法,设计并实现实时相关文献推荐子系统。最后,从理论......
在对个人和科研机构的评价研究中,针对难以准确、可靠地界定与识别科研团队的问题,将向量空间模型应用到作者合著关系网络的科研团......
该文分为两部分,两部分都是对自然语言理解中的词聚类进行研究:第一部分是面向特定领域的词聚类研究,实现了K平均聚类和分层聚类算......
在我国,网络教育发展迅速,其中,网络建设是基础,资源建设是核心.网络教育资源是实施网络教育的关键问题之一,是实施网络教学、考试......
本文主要是应用支持向量机的分类方法对中文文本进行自动分类。首先介绍了中文文本自动分类的框架体系,基于词典的中文自动分词技......
Internet的开放性和日益增长的规模,为人们提供了自由交换信息的便捷手段。同时巨大的开放信息源也使一些恶意的和不良的(反动、色......
本论文在对网络考试系统涉及的关键技术和理论进行深入研究的基础上,详细阐述了一个智能化考试系统的设计与实现。本系统的体系结构......
本文研究了一种基于改进K-means 算法的Web文档聚类系统,并开发出了一套由网络爬虫、数据清理、中文分词、特征提取、权重计算和聚......
文本是互联网上的主要信息载体,文本自动分类技术能够有效地将文本信息组织管理起来,帮助人们准确高效的定位文本信息,为用户获取所需......
发展迅速的信息技术,深刻地改变着人们的生活、生产和管理方式,加快了国家现代化和社会文明的发展。但是由于网络信息的开放性,信......
本文回顾了通用的信息检索技术,尤其是向量空间模型及其改进、倒排索引技术。分析了现有方法的长处和不足。基于对语料的统计分析,......
进入大数据时代,数据量呈指数式爆炸增长。相比于纵向扩展单机的处理性能和存储容量,采用分布式服务器架构来进行数据的存储和检索是......
随着Internet的迅猛发展,不可避免地使人们对有用信息的查找产生了巨大困难,因此文本挖掘的发展前景十分广阔,而文本聚类是文本挖......
随着信息时代的来临,电子文本信息迅速膨胀,如何有效地组织和管理这些信息,并准确、全面、快速地将用户所需要的信息从文本信息系......
随着web技术的更新,互联网络迎来了新一轮的大发展,在日新月异的信息时代里,人们可以在网络上获得更多有效的知识和数据。然而随着......
随着互联网的飞速发展,我们每天面对着越来越多需要处理的文本信息。如何从海量的文本信息中提取出所需要的目标信息,从而给人们更......
随着Web信息的急剧增长,人们迫切需要一种技术来对信息进行组织和管理,帮助用户快速、准确地找到需要的信息,数据挖掘和web技术相......
随着互联网和信息技术的快速发展,多媒体信息资源越来越多,对多媒体信息进行检索和分类也越来越重要。广播、会议、互联网上的语音数......
随着信息技术的不断发展,网页自动分类技术成为了Web领域的一个研究热点,它在信息检索、信息过滤等多个领域得到了广泛地应用。特......
在语音信号广泛应用的今天,如何对其进行合理和有效的管理,是目前语音信号处理研究的重点之一,其中语音文档的主题分类是人们研究的热......
随着信息技术的不断发展,网页的数量也在成倍的增加,如何通过网页自动分类技术有效的组织和管理这些海量数据已经成为Web领域的一......
自然语言处理作为人工智能的重要研究领域之一,是利用计算机进行语言知识的获取、表示以及应用的技术,为人与计算机之间的信息交流......
该文采用向量空间模型(Vector Space Model,VSM)来表示文本.针对特征向量维数较大、冗余词较多的问题,我们增加了语义处理过程,克......
文本作为信息的主要存储形式正在以惊人的速度增长。为了便于查找信息,多种信息检索模型应运而生,并在实际应用过程中得到了完善和提......
随着网络信息时代的到来,信息日新月异,并呈指数增长趋势,形成“信息爆炸”。在进行信息检索时,与用户需求匹配的信息经常不在检索结果......
近年来,随着Internet 的不断普及,越来越多的用户利用搜索引擎来搜索网上的信息,尽管搜索引擎的发展已经比较成熟,但人们却发现要......
文本自动分类是指在给定的分类体系下,根据文本内容自动确定文本所属类别。文本分类技术的出现,使文档可以自动地按照类别组织和处......
随着社会的发展,科学技术的进步,尤其是计算机技术的推广和运用为维吾尔语的研究和应用创造了良好的人文和科技环境,同时对传统的......
近年来,数字图像处理技术在矿物浮选过程中得到了广泛的研究与应用。浮选泡沫表面状态信息与浮选生产状况、经济指标之间密切相关,......
现代电子信息技术的快速发展使得互联网信息呈爆炸方式增长。然而,信息的急速增长却未能给用户提供方便,海量数据给用户获取知识带......
信息技术特别是互联网技术的发展,给人们的生活带来了深刻的变革,电子文档资源依靠计算机软硬件存储,具有易存储,易复制等特点,可......
目前越来越多的企业采用信息管理或知识管理系统来提高工作效率,在这样的系统中,企业员工实际在虚拟的协作环境下工作,他们需要得到与......
我们当前面临着信息爆炸的时代,如何从海量的信息获得所需要的成为人们在信息时代所面临的主要问题之一。随着信息检索技术研究的深......
随着科学技术的日新月异,特别是互联网的快速发展,各种信息情报激增,人们可以通过各种手段快速获取大量的文本资料,但是如何对所获取的......
随着互联网的普及,电子邮件以其快捷、方便的优点逐渐发展成为人们工作和生活的重要通信工具之一。然而,随之而来的垃圾邮件问题也......
对等网络作为一种新兴的网络计算模式,在工业界和学术界都受到了广泛的关注,并成为计算机领域研究的一个热点。与传统的C/S网络模......
近年来,电子邮件以其方便、快捷、低成本等优点已成为互联网交流沟通的重要途径,但是随之而来的是海量的垃圾邮件。垃圾邮件已经成为......
论文系统阐述并实现了一套 WEB 文本分类的技术。主要技术包括 WEB 文本收集、WEB 文本预处理、处理后的 WEB 文本的中文分词、预......